На страницу третьего семестра
С помощью программы formatdb были созданы индексные файлы, при этом использовались следующий параметры:
-i файл, подаваемый на вход -p тип последовательности в файле (T - аминокислотная, F - нуклеотидная) -n первая часть файла с расширением (nhr, nin или nsq)Для генома синегнойной палочки (Pseudomonas aeruginosa) использовалась команда:
formatdb -i pa_genome.fasta -p F -n pa
Поиск гомологов xxx_Ecoli | Геном Vibrio cholerae | Геном Pseudomonas aeruginosa | Геном Pasteurella multocida | |
Характеристика лучшей находки: | ||||
E-value находки | 3.4 | 2e-59 | 0.14 | |
координаты выравнивания(-ий) в записи генома |
14191-14069(complement) | 10075-9608(complement) | 5207-5082(complement) | |
AC соответствующей записи EMBL | AE004273 | AE004631 | AE006207 | |
Координаты CDS в записи EMBL (если они есть) | complement(12314..14254) | невозможно определить* | complement(4542..5525) | |
AC UniProt в записи EMBL (если есть) | Q9KQK8 | невозможно определить* | Q9CKB5 | |
Число находок с Е-value<0,01 |
- | 1 находка | - | |
E-value лучшей находки в трех геномах |
3е-59(Pseudomonas aeruginosa) | |||
Число находок с Е-value<0,01 в трех геномах |
1 находка |
Создала в своей директории индексные файлы BLAST для поиска по всем трем геномам сразу. С помощью выбранной ранее программы провела поиск по трем геномам. При создании индексных файлов одновременно трёх геномов были проведены следующие операции:
genpath=/home/export/samba/public/tmp
genomes="$genpath/vc_genome.fasta $genpath/pa_genome.fasta $genpath/pm_genome.fasta"
formatdb -i "$genomes" -n 3g -p F
Score = 54.0 bits (27), Expect = 3e-07 Identities = 99/123 (80%) Strand = Plus / Minus Query: 349 ggcgatggcattattagcgcgattaacttcaaactcgacgttaagaaagtggcggacccg 408 ||||| ||||| || |||||||| |||||||| || ||| | ||||| || | ||||||| Sbjct: 9727 ggcgacggcatcatcagcgcgatcaacttcaagctggacatcaagaaggtcgaggacccg 9668 Query: 409 gaaggtggcgaacgtgcggtcatcaccttagatggtaaatatctgccgaccaaaccgttc 468 ||||| ||| || ||||| |||||| | || || || || ||||||||||| |||||| Sbjct: 9667 gaaggcggctcgcgggcggtgatcaccctcgacggcaagtacctgccgaccaagccgttc 9608 Query: 469 tga 471 ||| Sbjct: 9607 tga 9605